Hadoop学习笔记（四）- MapReduce运行剖析

2017-06-12

1 MapReduce中的Shuffle机制

MR中，Map阶段处理的数据如何传递给Reduce阶段是MR框架中最关键的一个流程–Shuffle。
Shuffle的核心机制：数据分区、排序、缓存
具体来说就是将MapTask输出的处理结果分发给ReduceTask，并在分发的过程中对数据按key进行了分区和排序。

Shuffle缓存流程

Shuffle是MR处理流程中的一个过程，它的每一个处理步骤是分散在各个MapTask和ReduceTask节点上完成的，整体来看，分为3个操作：

详细流程

MapTask收集map方法输出的kv对，放到内存缓冲区中
从内从缓冲区中不断溢出到本地磁盘文件，可能会溢出多个文件
多个溢出文件会被合并成大的溢出文件
在溢出及合并的过程中，都要调用partitioner进行分组和针对key进行排序（快速排序）
ReduceTask根据自己的分区号，去各个Maptask机器上取响应的结果分区数据
ReduceTask会取到同一个分区的、来自不同MapTask的结果文件，并将这些文件再进行合并（归并排序）
合并成大文件后，shuffle的过程也就结束了，后面进入ReduceTask的逻辑运算过程（从文件中逐一取出K-VGroup，调用用户自定义的reduce方法）

Shuffle中的缓冲区大小会影响到MapReduce程序的执行效率，原则上说，缓冲区越大，磁盘的IO次数越少，执行速度就越快。缓冲区的大小可以通过参数io.sort.mb调整，默认为100M。